Este trabalho compara duas fontes de estimativa de um indicador de qualidade do AR(PM2.5) no estado do Espírito Santo(ES):
O PM2.5 é considerado um dos principais indicadores da qualidade do ar e uma das formas de poluição mais perigosas para a saúde humana.
PM: Sigla para Particulate Matter, ou Material Particulado. Refere-se a uma mistura complexa de partículas minúsculas (sólidas e líquidas) que estão suspensas no ar.
2,5 micrômetros (µm) ou menos de diâmetro.
Modelo CAMS: O CAMS é um serviço operacional de monitoramento global, combinando uma simulação computacional com observações reais (satélite + solo) para criar um conjunto de dados global e consistente sobre a qualidade do ar.
Modelo Donkelaar: O modelo van Donkelaar é um método estatístico avançado que traduz medições visuais de satélite em concentrações de PM2.5 no solo, usando estimativas históricas para garantir eficiencia.
Objetivo: Avaliar a correlação, concordância e as diferenças entre os dois modelos para os anos de 2022 e 2023.
Trazendo uma perspectiva do estado do Espirito Santo(ES), se espera uma concentração maior de poluição do AR na região mais metropolitana que é o Centro junto a capital Vitória, assim como esperava-se menos poluição na região Norte por ser mais região de mata.
Há uma diferença exclamativa nos dados, visto que os dados do modelo cams são diários, já no modelo donkelaar os dados estão agrupdos em estatistica descritivas(media, desvio padrão, etc) por mês, ambos para cada municipio em determinado ano
Assim a principal métrica adotada para os estudos foi a media do mês do pm2.5
Descrevendo um pouco de informação aos meses:
Em ambos os anos conseguimos observar que os valores de PM2.5 no método CAMS estão muito mais concentrados.
Tambem note-se que em janeiro e fevereiro os limites do nível de PM2.5 são maiores o que pode estar relacionado com a estação visto que são os meses de maior impacto do verão.
Em 2023 no meio do ano os métodos ficaram mais igualitários.
já podemos notar uma diferença dos métodos empiricamente, mas conotaremos uma medição para essa relação
Olhando pro recorte anual, peguei o mapa do Espirito Santo para representar geográficamente a média anual do PM2.5 de cada modelo em cada municipio.
além dos modelos apresentamos a diferença entre os modelos em cada ano e a média dos 2 anos em cada modelo
utliizamos faixas conhecidas globalmente para classificar a medidade de poluição no AR PM2.5, são elas:
## [1] "0-5: Ideal" "5-10: Bom" "10-15: Aceitável"
## [4] "15-20: Moderado" "20-25: Ruim" "25-30: Muito Ruim"
## [7] "30-35: Perigoso" "35+: Crítico"
Modelo CAMS:
Em ambos os anos no modelo CAMS a suma maioria dos municipios tiveram classificação BOM, salvo alguns na região central em 2022 que tiveram classificação aceitável.
Modelo Donkelaar:
Já no Donkelaar temos um maior nível de PM2.5 pela região Sul. vemos o maior valor de poluição alcançado na cidade de Vitória, capital do estado.
Diferença entre os modelos em cada ano:
Pelos resultados já esperava-se que ficaria igual seguindo as faixas conhecidas
Sendo mais incisivo com a classificação de poluição para as médias
dos anos pra cada modelo decidi retirar as faixas desagregando os
municipios.
Na media dos anos fica mais explicito que há uma concentração maior de poluição do AR pela região central e na parte metropolitana da cidade perto de vitoria
Alguns dados interessantes sobre o estado do Espirito Santo:
| 2022 | 2023 | |
|---|---|---|
| media_donk | 9.958505 | 9.300144 |
| desvio_padrao_donk | 1.619843 | 1.789296 |
| max_donk | 14.55857 | 16.32374 |
| municipio_max_donk | Vitória | Vitória |
| min_donk | 7.159964 | 6.128573 |
| municipio_min_donk | Mucurici | Pedro Canário |
| media_cams | 8.472840 | 7.379759 |
| desvio_padrao_cams | 1.1307607 | 0.9098515 |
| max_cams | 10.752730 | 9.016256 |
| municipio_max_cams | Domingos Martins | Venda Nova do Imigrante |
| min_cams | 6.265517 | 5.451837 |
| municipio_min_cams | Linhares | Conceição da Barra |
| media_diff | 1.688852 | 1.920385 |
| desvio_padrao_diff | 1.172419 | 1.244632 |
| max_diff | 6.341410 | 8.989046 |
| municipio_max_diff | Vitória | Vitória |
| min_diff | 0.03495796 | 0.15809982 |
| municipio_min_diff | Pancas | Pedro Canário |
No gráfico de dispersão cada posição está relacionado a um valor de PM2.5 de cada método pra cada mês de um certo municipío
Pelo posição de cada perfil, e a linha de regressão vê que fica claro que tem uma correlação, até mesmo por diversos parametros estarem iguais em ambos os metodos, elas seguem um angulo plausível ao compreendimento de que há uma relação
##
## Pearson's product-moment correlation
##
## data: dispersao22$Donkelar and dispersao22$cams
## t = 16.612, df = 934, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.4265454 0.5255657
## sample estimates:
## cor
## 0.4775707
## [1] 0.4775707
##
## Spearman's rank correlation rho
##
## data: dispersao22$Donkelar and dispersao22$cams
## S = 69622923, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.4905795
##
## Pearson's product-moment correlation
##
## data: dispersao23$Donkelar and dispersao23$cams
## t = 11.526, df = 934, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.2954888 0.4077439
## sample estimates:
## cor
## 0.3528855
## [1] 0.3528855
##
## Spearman's rank correlation rho
##
## data: dispersao23$Donkelar and dispersao23$cams
## S = 78682568, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.4242914
A conclusão principal é que existe uma relação positiva e estatisticamente significante entre os métodos “Donkelaar” e “cams” nos dois anos, mas essa relação foi visivelmente mais fraca em 2023 do que em 2022.
ambos os testes deram uma correlação moderada entre os metodos.
Em ambos os anos, o modelo “Donkelar” mede, sistematicamente, valores mais altos que o “cams” (um viés positivo).
No entanto, o padrão desse erro mudou drasticamente:
Em 2022, a diferença era consistente (viés uniforme).
Em 2023, a diferença explodiu em dias de alta poluição (viés proporcional).
Isso explica perfeitamente por que sua correlação foi mais fraca em 2023 (r=0.35) do que em 2022 (r=0.48).
## Single Score Intraclass Correlation
##
## Model: twoway
## Type : consistency
##
## Subjects = 936
## Raters = 2
## ICC(C,1) = 0.396
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(935,935) = 2.31 , p = 8.3e-37
##
## 95%-Confidence Interval for ICC Population Values:
## 0.34 < ICC < 0.448
## Single Score Intraclass Correlation
##
## Model: twoway
## Type : agreement
##
## Subjects = 936
## Raters = 2
## ICC(A,1) = 0.334
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(935,54) = 2.31 , p = 0.000112
##
## 95%-Confidence Interval for ICC Population Values:
## 0.163 < ICC < 0.469
## Single Score Intraclass Correlation
##
## Model: twoway
## Type : consistency
##
## Subjects = 936
## Raters = 2
## ICC(C,1) = 0.28
##
## F-Test, H0: r0 = 0 ; H1: r0 > 0
## F(935,935) = 1.78 , p = 1.17e-18
##
## 95%-Confidence Interval for ICC Population Values:
## 0.22 < ICC < 0.338
Ambos os anos tiveram um teste de concordância < 0.50: Concordância Ruim
Um valor de 0.334 é classificado como “Ruim”. Isso prova que, se você pegar uma medição do Donkelar e uma do cams para o mesmo dia e local, elas não serão iguais. A concordância nos valores absolutos é baixíssima.
O ICC de Consistência (Consistency) = 0.396 e suas Correlações (r = 0.48 e r = 0.35). Mesmo se esquecermos os valores absolutos e apenas perguntarmos: “Quando o Donkelaar sobe, o Cams também sobe?”, a resposta é “apenas mais ou menos”. Um valor de 0.396 também é classificado como “Ruim”. Isso mostra que os modelos não seguem confiavelmente o mesmo padrão de poluição.
Viés Sistemático (Erro Fixo): O gráfico de 2022 mostra que a linha de diferença média (linha azul) está sempre acima de zero. Isso prova que o Donkelar reporta, sistematicamente, valores mais altos que o cams.
Viés Proporcional (Erro Variável): O gráfico de 2023 mostra um padrão de “cone”. Isso prova que a discordância piora à medida que a poluição aumenta. Em dias limpos, eles quase concordam, mas em dias muito poluídos, o Donkelar reporta valores drasticamente mais altos que o cams.
Os modelos Donkelar e cams não medem a mesma coisa. A análise quantitativa (ICC = 0.334) prova que a concordância absoluta é ruim. A análise visual (Bland-Altman) explica o porquê: o modelo Donkelar apresenta um viés positivo (mede a mais) que se torna proporcionalmente maior em dias de alta poluição.